¿Pueden los LLM razonar estructuralmente?
Descubre DSR-Bench, el benchmark que revela las limitaciones en razonamiento estructural de los LLM. ¡El mejor modelo solo obtiene 0.46/1!
Descubre DSR-Bench, el benchmark que revela las limitaciones en razonamiento estructural de los LLM. ¡El mejor modelo solo obtiene 0.46/1!
Las sondas de razonamiento en circuitos booleanos con bucle ofrecen garantías estadísticas óptimas sin depender del tamaño del grafo. ¡Descubre más!
Mejora el razonamiento algorítmico neuronal con reconstrucción auxiliar: representaciones más ricas que potencian el rendimiento de arquitecturas existentes.